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基于 深度 学 习 与 语义 控 据 的 技术 创新 组 合 识 别 与 追踪 - 
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摘 X [目的 /意义 ] 随 着 战略 型 新 兴 技 术 产 业 的 迅猛 发 展 ,如 何 识别 具有 潜在 协同 效应 的 技术 创新 组 合 、 厘 清 组 合 中 核 


心 的 创新 关系 ,是 有 效 规划 产业 发 展 路 线 . 提 升 产业 竞争 优势 的 重要 前 提 。[ 方 法 /过 程 | 在 技术 组 合 进 化 理论 的 
指导 下 ,结合 深度 学 习 、SAO 语义 挖掘 和 CFDP 算法 ,提出 一 种 基于 专利 数据 的 技术 创新 组 合 与 演化 关系 的 识别 方 
案 。 该 研究 方案 共 分 为 3 个 步骤 :首先 基于 关键 词 与 专利 分 类 号 构建 领域 检索 策略 ,并 实现 对 获取 数据 的 清洗 和 
分 词 。 随 后 ,通过 Word2Vec 构建 领域 技术 主题 的 词 向 量 语义 网 络 ,并 利用 CFDP 算法 识别 出 潜在 创新 要 素 及 组 合 
方式 。 最 后 ,深入 挖掘 各 组 合 中 核心 的 SAO 结构 ,通过 LSTM 深度 学 习 算 法 对 其 演化 关系 进行 分 类 ,挖掘 技 术 的 
核心 创新 方式 ,进而 有 效 甄别 领域 潜在 的 技术 机 会 。[ 结果 /结论 ] 以 语音 识别 领域 为 例 , 通 过 对 该 领域 DIT 专利 
文本 数据 的 深入 挖掘 ,识别 并 追踪 5 个 潜在 的 技术 创新 组 合 及 核心 创新 方式 。 研 究 发 现 , 当 前 我 国语 音 识别 领域 


Pese. 技术 创新 组 合 识别 ”深度 学 习 SAO 法 语义 挖 气 
zx: 6305 


- 10. 13266/j. issn. 0252 —3116. 2022. 10. 003 


在 智能 芯片 设计 、 语 音 识别 算法 、 新 场景 和 应 用 等 方面 有 较 大 的 创新 潜力 。 
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ON 随 着 全 球 科技 创新 进入 空前 密集 活跃 的 时 期 , 间 
一 著 科 技 革命 和 产业 变革 正在 重 构 全 球 创新 版 图 、 重 
彰 洽 球 经 济 结构 。 我 国 要 想 实现 高 水 平 的 科技 自立 自 
强 0 叶 要 加 快 提高 创新 能 力 和 创新 水 平 。2020 年 9 月 ， 
习近平 总 书记 在 科学 家 座谈 会 上 深刻 六 明了 在 当今 充 
满 亏 战 的 世界 形势 下 加 快 科技 创新 发 展 的 重大 战略 意 
义 。 尤 其 是 在 一 些 关键 核心 的 新 兴 技 术 领 域 ,我 国 要 
想 构筑 高 端 引领 的 先 发 优势 ,就 要 把 握 创 新 的 源头 和 
方向 ,集中 资源 和 力量 ,力求 实现 突破 与 创新 。 然 而 ， 
由 于 新 兴 技 术 更 类 速度 快 ,新 的 技术 和 应 用 不 断 洒 
现 " 。 在 这 种 背景 下 ,“ 如 何 准确 定位 技术 的 创新 方 
向 “如 何 规划 技术 的 创新 方式 "是 当前 政府 及 产业 界 
面临 的 两 大 科学 难题 。 而 对 该 类 科学 问题 的 解决 对 缩 
短 技术 创新 周期 .提升 产业 竞争 优势 有 重要 意义 。 
针对 这 些 问题 ,学 术 界 已 对 其 解决 方案 进行 了 初 
步 探 索 ,尝试 利用 文献 计量 及 文本 挖掘 等 定量 化 分 析 
方法 识别 潜在 的 技术 创新 机 会 ,并 形成 了 一 些 有 价值 


的 研究 成 果 。 然 而 当前 研究 大 多 只 关注 结果 , 即 仅 识 
别 出 未 来 有 价值 的 技术 创新 方向 ,缺乏 对 技术 创新 原 
理 及 机 制 的 深入 探索 ,因而 无 法 回答 “技术 将 以 何 种 方 
式 进 行 有 效 创新 ”这 一 焦点 问题 。 同 时 这 一 兹 端 也 将 
导致 无 法 追踪 技术 创新 过 程 ,继而 无 法 帮助 产业 有 效 
调整 技术 创新 方向 。 

近年 来 ,部 分 学 者 围绕 “演化 创新 ”这 一 动态 发 展 
观 展开 创新 主题 的 识别 研究 。 其 中 ,技术 思想 家 布 莱 
恩 * 阿 瑟 提出 的 技术 组 合演 化 理论 是 典型 的 代表 。 他 
提出 “任何 技术 都 衍生 于 以 往 技术 集合 ”以 及 “技术 从 
自身 创 生 了 自身 "这 一 “ 自 创 生 ” 观 点 ,并 系统 阐述 了 
技术 的 模块 化 思想 以 及 其 中 的 组 合演 化 关系 。 由 此 说 
明 ,技术 间 的 组 合演 化 是 实现 技术 创新 的 一 种 重要 方 
式 。 在 此 基础 上 , 随 着 深度 学 习 技术 的 发 展 ,从 海量 的 
科技 数据 中 挖掘 隐 含 的 技术 演化 关系 成 为 可 能 。 

当前 人 工 智 能 是 新 一 代 信息 技术 的 发 展 前 沿 与 研 
发 重点 ,在 新 一 轮 国际 竞争 中 处 于 首要 地 位 ”。 我 国 
高 度 重视 人 工 智能 产业 的 创新 发 展 ,在 “十 四 五 ”规划 
中 将 人 工 智 能 界定 为 未 来 10 年 最 优先 发 展 的 产业 。 
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其 中 ,语音 识别 是 人 工 智 能 领域 中 的 核心 研发 方向 ,是 
近年 来 产业 界 关 注 的 焦点 。 然 而 ,由 于 该 领域 的 多 学 
科 交 又 属 性 ,涉及 的 子 技术 、 子 应 用 繁多 ,如 何 从 不 断 
涌现 的 新 技术 .新 应 用 中 甄别 出 有 基础 有 潜力 的 发 展 
方向 ,成 为 国家 和 产业 层面 重点 关注 的 问题 。 在 这 一 
背景 下 ,笔者 在 深入 挖掘 技术 进化 机 制 的 基础 上 ,系统 
剖析 语音 识别 领域 技术 模块 组 合 方式 及 演化 特征 。 并 
在 此 基础 上 ,基于 深度 学 习 、SAO 语义 挖掘 等 方法 构建 
技术 创新 组 合 识 别 模型 ,实现 对 该 领域 技术 创新 主题 
及 创新 方式 的 有 效 探索 ,为 推动 我 国语 音 识别 技术 的 
人 研发 .培育 提供 有 效 支 撑 。 


2 研究 综述 


lx 技术 创新 主题 识别 的 核心 理论 与 方法 
-一 随 着 学 界 对 新 兴 技 术 的 概念 特征 发 展 规律 .识别 
通 价 方法 的 不 断 深入 研究 ,针对 新 兴 技术 创新 主题 
识别 研究 逐渐 形成 了 两 大 研究 视角 ;基于 计量 学 的 识 
别 视角 及 基于 演化 理论 的 识别 视角 ”。 其 中 ,基于 文 
献 评 量 的 研究 视角 是 当前 的 主流 研究 方向 ,该 类 研究 
汰 要 从 科技 文献 中 展示 的 成 果 数量 ` 研 发 主体 的 相关 
交大 等 方面 挖 所 技术 发 展 的 宏观 规律 ,从 而 探索 潜在 
的 忽 术 主题 与 发 展 机 会 。 杜 建 等 "采用 论文 共 被 引 和 
区 剂 看 合 来 识别 临床 医学 领域 的 前 沿 技术 ;J Liu 
等 号 利用 文献 计量 及 主题 分 析 法 来 识别 基因 编辑 领域 
的 级 兴 技 术 主题 。 但 由 于 该 类 研究 没有 考虑 到 技术 发 
民生 内 生效 应 ,很 难 解释 受 内 部 创新 .外 部 融合 以 及 其 
他 社会 因素 综合 影响 而 产生 的 技术 创新 方式 。 而 演化 
视 出 则 是 从 技术 进化 的 角度 出 发 ,考虑 到 随时 间 变 化 
技术 主题 间 的 融合 演化 \ 再 生 等 关系 。 尤 其 是 在 引入 
技术 形态 分 析 SAO 语义 挖掘 等 基于 关系 的 分 析 方法 
后 ,该 研究 视角 可 直观 地 发 现 新 兴 技 术 自 下 而 上 的 动 
态 形成 过 程 ,弥补 了 计量 视角 对 于 创新 要 素 及 创新 规 
律 解释 不 足 的 缺陷 。W，Schoenmakers 等 "通过 分 析 
不 同类 型 的 颠覆 性 技术 ,尝试 从 融合 视角 探索 成 熟 技 
术 与 多 学 科 知识 在 技术 演进 过 程 中 产生 的 交叉 创新 ; 
M. Karvonen 等 “通过 构建 引文 关联 网 络 对 技术 的 融 
合 汇聚 特征 进行 判别 ,实现 对 初始 阶段 技术 融合 方式 
的 有 效 预测 。 

本 研究 关注 技术 的 组 合 创新 机 理 , 因 此 ,本 部 分 将 
重点 对 基于 组 合演 化 理论 的 技术 创新 主题 识别 研究 的 
相关 成 果 进 行 有 效 综述 。 

2.2 ”基于 组 合演 化 理论 的 技术 创新 主题 识别 研究 

最 早出 现 的 关于 组 合演 化 理论 的 研究 可 追溯 至 


1912 年 约瑟夫 熊 彼 特 提出 的 “组 合 驱动 创新 ”理论 。 
该 理论 提出 将 关于 生产 要 素 和 生产 条 件 从 未 有 过 的 新 
组 合 引 入 至 生产 体系 中 ,结果 中 发 生 的 任何 变化 都 可 
被 认为 是 源 于 生产 方式 的 新 组 合 ”。 随 后 ,美国 天 体 
物理 学 家 绅 里 蒋 . 兹 威 基 在 20 世纪 40 年 代 进 一 步 提 
出 了 “形态 分 析 理 论 ”。 该 理论 强调 技术 领域 (系统 ) 
可 被 拆 分 为 若干 个 功能 部 分 ,通过 组 合 各 部 分 的 技术 
手段 (形态 ) ,可 解决 复杂 的 科学 问题 。2011 年 美国 学 
EMKE - 阿 瑟 在 《技术 的 本 质 》 一 书 中 提出 ， 创 新 
中 少 部 分 是 原 发 性 .根本 性 的 ,有 相当 大 的 部 分 是 通过 
领域 内 、 外 技术 的 移植 .融合 产生 的 组 合 创新 ”” 。 
内 也 有 学 者 对 组 合 创 新 的 本 质 进行 了 论述 。 孙 冰 从 
“技术 创新 动力 机 制 ” 这 一 方向 提出 创新 要 素 间 的 自 
组 织 能 有 效 描述 系统 内 构成 要 素 间 的 复杂 创新 关 
RU ; 述 学 芹 等 "认为 所 谓 组 合 创 新 法 是 研究 人 员 将 
两 个 或 两 个 以 上 的 独立 技术 原理 通过 巧妙 的 结合 或 重 
组 ,从 而 获得 一 个 具有 完整 统一 功能 的 新 发 明 ; 吴 红 
等 '” 提 出 技术 在 发 展 过 程 中 ,已 有 的 旧 技 术 之 间 、 新 
技术 之 间或 者 新 旧 技 术 之 间 都 有 可 能 产生 联结 (组 
合 ) ,进而 形成 新 的 科技 创新 。 而 技术 正 是 在 "组合 - 
累积 - 再 组 合 - 再 累积 "这 一 循环 过 程 中 实现 缓慢 进 
化 。 综 上 所 述 ,技术 创新 离 不 开 技术 要 素 的 融合 与 重 
组 。 通 过 对 技术 创新 机 制 和 组 合 方式 的 有 效 探索 ,可 
更 好 地 识别 出 有 价值 的 技术 机 会 。 

当前 关于 技术 组 合 识别 的 研究 主要 基于 网 络 分 析 
和 聚 类 分 析 等 方法 ,如 周 丽 英 等 "通过 构建 专利 合作 
研发 网 络 , 根 据 技术 的 领域 相关 性 来 寻找 专利 技术 组 
合 ; 张 振 刚 等 "将 技术 分 解 为 知识 元 素 之 间 的 组 合 ， 
通过 复 用 现 有 知识 组 合 和 探索 新 的 知识 组 合 两 种 方式 
挖 气 出 具有 潜力 的 技术 组 合 ; 王 贤 文 等 ”采用 Girvan- 
Newman 算法 进行 技术 共 类 网 络 的 聚 类 分 析 ,结合 社会 
网 络 分 析 和 信息 可 视 化 技术 ,探索 关键 技术 领域 及 技 
术 网 络 结构 ,并 在 此 基础 上 进一步 识别 相关 技术 的 组 
合 模 式 。 笔 者 所 在 研究 团队 "也 曾 尝 试 对 技术 领域 
进行 子 系统 划分 ,并 在 此 基础 上 融合 网 络 分 析 和 文本 
挖掘 等 方法 ,实现 对 领域 技术 的 重组 与 潜力 评估 。 上 
述 几 种 方法 考虑 到 了 领域 的 技术 属性 ,在 识别 潜在 的 
技术 组 合 上 效果 显著 。 但 仍然 未 能 对 技术 间 的 创新 关 
联 进行 系统 探索 ,因此 无 法 对 潜在 的 技术 创新 方式 进 
行规 划 。 近 年 来 ,部 分 学 者 尝试 从 语义 角度 出 发 ,利用 
SAO 法 (Subject-Action-Object) 深 入 探索 技术 主题 之 间 
的 演化 ,构成 关系 ,从 而 识别 有 潜在 关联 的 技术 创新 组 
合 。 李 欣 等 … 对 专利 中 核心 SAO 语义 结构 进行 分 析 ， 
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AR, 许 银 彪 ， 史 益 . 基于 深度 学 习 与 语义 挖掘 的 技术 创新 组 合 识别 与 追踪 []]. 图 书 情报 工作 ,2022 ,66(10) :33 -44. 


揭示 技术 主题 之 间 的 关联 关系 ,从 而 提出 有 效 识别 技 
术 创 新 领域 的 方法 体系 ; 苗 红 等 ”创新 性 地 提出 以 功 
能 为 导向 的 技术 融合 分 析 框 架 , 在 综合 利用 SAO 与 
“技术 - 关系 - 技术”(Technology-Relationship-Technol- 
ogy , TRT) 结构 关系 的 基础 上 ,分 析 和 预测 在 同一 功能 
篮 中 的 技术 融合 总 趋势 ,为 技术 创新 组 合 的 识别 研究 
提供 了 新 思路 。 

综 上 所 述 ,当前 学 界 已 对 如 何 识别 技术 创新 组 合 、 
理 清 其 进化 关系 进行 了 初步 探索 ,并 取得 了 一 些 有 价 
值 的 研究 成 果 。 然 而 既 有 研究 仍 存在 两 大 问题 :中 多 
利用 显 性 关系 (如 技术 点 间 共 线 关系 ) 来 界定 技术 组 
合 的 关联 要 素 ,缺乏 对 技术 要 素 间 如 “功能 相似 性 "或 
“应 用 相似 性 ”引发 的 潜在 关联 的 深入 探索 ;@ 缺 乏 对 


随 着 深度 学 习 算法 的 兴起 ,与 之 结合 的 SAO 法 ， 
可 深入 探索 海量 非 结 构 化 文本 中 蕴含 的 复杂 演化 关 
系 , 因 而 在 大 规模 数据 处 理 ,深度 语义 挖掘 等 方面 有 巨 
大 的 潜力 。 基 于 此 ,笔者 在 系统 剖析 技术 组 成 原 
理 的 基础 上 ,融合 深度 学 习 、SAO 语义 分 析 等 方法 , 探 
索 技 术 创 新 组 合 的 识别 方案 ,并 对 其 技术 创新 关系 进 
行 深入 挖掘。 
3 ”研究 方法 

本 研究 致力 于 探索 两 大 科学 问题 的 解决 方案 : 
QD“ 如 何 准确 定位 技术 的 创新 方向 ”, 即 识别 技术 创新 
组 合 是 什么 ;@“ 如 何 有 效 规划 技术 的 创新 方式 ”, 即 
各 创新 要 素 应 如 何 关联 ,从 而 实现 技术 创新 。 因 此 , 研 
究 共 分 成 两 大 阶段 。 研 究 框 架 如 图 1 所 示 : 


z 
| 
[ 数据 清洗 | 


(ITG insight) 
| 
L 术语 抽取 | 


技术 主题 词 表 


(Word2Vec) 三 词义 信息 


一 向 量 表示 


核心 技术 主题 及 组 合 创新 要 素 


(CFDP) 


领域 概念 模型 专家 访谈 


1 
1 
1 
1 
l 
1 
1 
l 
| 
| 
1 
l 
1 
1 


海量 文本 中 技术 要 素 间 复杂 关系 的 智能 挖掘 ,因而 无 
法 有 效 王 别 技术 间 核 心 的 创新 方式。 

第 一 阶段 ， 技术 创新 组 合 识别 
e BE ORO dE 

1. 制定 领域 检索 策 四 

e DII 专 利 数据 

< 十 

c 2. 构建 领域 语义 网 络 

Co 

PAEA 
N 如 何 准确 定位 技术 
c 的 创新 方向 
3 识别 语义 网 络 中 的 核心 节点 

N 

2 

S< 4. 领域 基础 模块 划分 

a 文献 综述 材料 

c 

de 

O 1 识别 技术 主题 间 语义 关联 关系 


专利 文本 信息 


如 何 规划 技术 的 
创新 方式 


技术 创新 关系 


(Python) 词性 标注 


[- 促进 (pos) 
减弱 (neg) 


包含 (con) 
L 应 用 (apl) 


2. 挖掘 领域 潜在 技术 机 会 


领域 核心 研发 者 


创新 要 素 间 核心 关系 


领域 潜在 技术 机 会 


ns ls 


1 研究 框架 


3.1 技术 创新 组 合 识别 

如 何 基 于 海量 专利 数据 识别 “技术 将 在 何 处 创 
新 "是 本 研究 关注 的 第 一 个 问题 。 前 期 调研 中 发 现 , 单 
独 的 技术 主题 因 不 能 有 效 反映 领域 创新 要 素 及 创新 方 
式 , 对 商业 决策 的 支撑 度 有 限 。 因 而 如 何 基 于 技术 创 


新 的 基本 规律 ,探索 具有 潜在 协同 效应 的 技术 创新 组 
合 是 本 研究 关注 的 重要 问题 。 基 于 这 一 研究 需求 ,本 
部 分 尝试 基于 词 向 量 方法 构建 能 反映 技术 间 潜 在 关联 
的 上 下 文 语义 网 络 。 与 传统 基于 词语 共 现 关系 构建 的 
网 络 不 同 ,该 网 络 中 节点 位 置 体现 了 这 些 技术 点 之 间 
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“潜在 ”的 研究 关联 , 即 技术 点 拥有 相似 的 功能 或 应 用 
方式 ,有 组 合 实现 某 一 创新 进程 (应 用 ) 的 潜力 。 为 了 
实现 这 一 思路 ,将 从 以 下 4 个 步骤 展开 研究 : 

第 一 ,制定 领域 检索 策略 ,获取 领域 专利 数据 。 随 
后 ,利用 ITG insight 的 文本 分 词 清洗 及 合并 等 功能 ， 
完成 对 领域 主题 词 的 初步 筛选 和 -2 。 
第 二 ,以 初始 关键 词 为 输入 ,基于 Word2vec 模型 
构建 领域 语义 网 络 。 其 中 , Word2vec ” 是 用 来 计算 单 
词 词 向 量 的 神经 网 络 概率 语言 模型 ,能 够 充分 控 气 文 
本 的 上 下 文 语义 信息 。 

第 三 ,基于 CFDP 算法 ,从 节点 密度 与 距离 这 两 个 
指标 出 发 ,识别 语义 网 络 中 的 核心 节点 局 。 需 要 重点 
说 明 的 是 ,核心 节点 应 满足 两 个 特征 :周围 节点 密度 
低 手 该 节点 ;@ 周 围 节 点 距离 该 节点 相 较 于 其 他 节点 
SENE, 

对 于 局 部 密度 的 计算 ,笔者 采用 Cut-off kemal 77 
如 公式 (1 ) 所 示 : 


C 


c pi — X cn C; -d.) 


公式 (1) 
eibi GO 表示 节点 间 的 距离 心 是 否 大 于 等 于 提 
要 定 的 截断 距离 4. , 若 大 于 等 于 则 取 0, 小 于 则 取 1 ， 
WSR Q) BR s 


ua 


x 74) o T 公式 (2) 
i T 0, xz0 
全 节点 间距 离 6, 的 计算 , 则 分 两 种 情况 :四 对 于 非 
扁 上 密度 最 大 点 i, 其 距离 计算 可 分 为 两 步 , 一 是 找到 
所 局 部 密度 比 i 点 高 的 点 ,二 是 在 这 些 点 中 找到 距 
离 妃 $ 最 近 的 点 j,i 和 j 的 距离 就 是 8 的 值 。@ 对 于 局 
部 筠 度 最 大 点 ,6, 则 是 该 点 和 所 有 其 他 点 距离 的 最 大 
值 ,如 公式 (3 ) 所 示 : 

ô= min,, >pi(d,) ARO) 

基于 公式 1 -公式 3 ,筛选 出 密度 及 距离 均 显 著 大 
于 其 他 点 的 节点 作为 核心 节点 ,并 按照 距离 筛选 出 与 
该 节点 有 紧密 关联 的 若干 节点 ,作为 潜在 的 组 合 创新 
要 素 。 

第 四 ,在 文献 学 习 与 专家 意见 的 指导 下 构建 领域 
概念 模型 ,并 通过 概念 模型 中 技术 模块 的 分 类 组 成 关 
系 ,对 各 组 合 中 的 创新 要 素 进行 归 类 。 

3.2 ”组 合 创新 方式 识别 

本 研究 的 第 二 个 研究 问题 是 “技术 将 以 何 种 方式 
进行 有 效 创新 ”。 为 了 解决 这 一 问题 ,在 识别 各 组 合 创 
新 要 素 的 基础 上 ,本 研究 进一步 探索 创新 要 素 间 的 组 
合 进化 规律 ,从 而 有 效 规划 技术 创新 方式 。 三 元 组 提 
UA (SAO) 能 够 展现 技术 点 间 的 语义 关联 ,是 技术 演 


化 关系 识别 中 最 具 代 表 性 的 一 种 方法 。 在 SAO 结构 
中 S 指 主语 ,0 指 宾语 , 均 代表 技术 主题 ;A 指 动词 , 反 
映 技术 进化 方式 。 从 前 期 研究 中 可 以 发 现 ,与 深度 学 
习 相 结合 的 SAO 方法 可 以 深度 挖掘 海 量 文本 中 的 语 
义 信息 ,是 探索 技术 主题 创新 方式 的 重要 方法 。 因 此 ， 
在 这 一 阶段 ,本 研究 构建 基于 SAO 法 与 深度 学 习 相 结 
合 的 组 合 创新 方式 识别 方案 。 

由 于 SAO 结构 中 技术 进化 关系 主要 由 谓语 动词 A 
来 表征 ,本 研究 对 其 进化 关系 的 识别 , 即 转 化 为 对 其 谓 
语 动 词 A 的 分 类 。 笔 者 基于 长 短期 记忆 神经 网 络 
(Long Short-Term Memory ,LSTM ) 这 一 深度 学 习 算 法 来 
识别 SAO 结构 中 的 技术 进化 关系 。LSTM 是 一 种 基于 
循环 神经 网 络 (Recurrent Neural Networks, RNN ) 的 深 
度 学 习 算 法 ,其 在 RNN 的 基础 上 增加 了 有 记忆 功能 的 
“ 门 ?来 控制 神经 元 中 信息 的 出 入 ,对 累积 学 习 随 时 间 
变化 的 短文 本 中 的 语义 关系 、 进 而 进行 文本 分 类 有 较 
好 效果 。 因 而 ,笔者 拟 采用 LSTM 算法 ,对 海量 SAO 
结构 中 的 创新 关系 进行 挖掘 。 具 体 步 骤 如 下 : 

第 一 ,使 用 TextBlob 包 对 专利 文本 进行 分 句 处 理 ， 
并 以 上 阶段 获取 的 核心 创新 要 素 作为 构成 S 和 0 的 核 
心 语 料 , 随 后 借助 正则 表达 的 基本 语法 提取 专利 文本 
中 同时 包含 S 和 0 的 短 句 。 

第 二 ,通过 词性 标注 的 方式 ,识别 句子 中 S 和 0 之 
间 的 动词 a, 构成 动词 列表 A=[a,a,,…,a,]。 

第 三 ,句子 化 简 。 将 提取 出 的 S.A、0 按照 在 句 中 
出 现 的 顺序 ,拼接 为 精简 的 SAO 结构 。 重 复 以 上 三 
步 , 完 成 对 所 有 人 句子 的 化 简 。 

第 四 ,将 具有 相同 S 和 0 的 SAO 结构 分 为 一 组 ， 
继而 对 同一 组 SAO 中 A 所 代表 的 技术 进化 关系 进行 
学 习 与 分 类 。 通 过 领域 调研 与 专家 访谈 ,笔者 将 领域 
核心 的 创新 关系 分 为 促进 、 减 少 、 包 含 和 应 用 4 类 ,每 
种 关系 的 含义 和 解释 如 表 1 所 示 : 

A1 创新 关系 分 类 及 含义 


关系 标签 含义 

促进 pos 某 技术 能 提升 增进 男 一 技术 (或 属性 ) 

减弱 neg 某 技术 能 削弱 .抑制 某 项 性 能 (或 属性 ) 

包含 con 某 一 技术 是 另 一 技术 的 组 成 部 分 或 关键 组 件 
应 用 apl 某 一 技术 能 应 用 到 另 一 技术 或 领域 


第 五 , 随机 抽取 一 定 比 例 的 SAO 结构 作为 训练 
集 ,并 在 专家 的 帮助 下 ,对 其 创新 关系 (A) 进行 人 工分 
类 (赋予 标签 )。 需 要 说 明 的 是 ,由 于 专利 文本 中 的 
SAO 结构 ,A 通常 是 客观 描述 某 种 进化 方式 的 动词 (如 
“促进 "“ 共 同 作用 “包含 "等 ) ,不 具有 强烈 的 情感 倾 
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AR, 许 银 彪 ， 史 益 . 基于 深度 学 习 与 语义 挖掘 的 技术 创新 组 合 识别 与 追踪 []]. 图 书 情报 工作 ,2022 ,66(10) :33 -44. 


向 ,因此 用 无 监督 式 的 分 类 算法 效果 不 佳 。 基 于 此 , 笔 
者 采用 有 监督 式 的 学 习 方式 ,提前 对 部 分 结构 进行 人 
工分 类 ,实现 对 核心 创新 关系 的 有 效 学 习 。 

第 六 ,将 上 一 步 人 工分 类 的 数据 作为 LSTM 模型 的 
输入 样本 ,经 过 向 量 转化 ,循环 迭代 后 ,利用 逻辑 回归 得 


步骤 一 ”基于 正则 表达 ， 识 别 句 首 和 句 尾 的 技术 词 


步骤 二 ”词性 标注 ,识别 谓语 动词 


NNP VBZ VB DT HN 


a 


SuAiOun 
SIAOI 4 SpA:0n 其 中 
SsA3055 


词 S 和 O 之 间 的 进化 关系 
模型 训练 : 将 训练 样本 集 作为 输入 数据 ， 


202304.00781v1 


fi: Microphone arrays capture the spatial characteristics ofthe sound field to improve voice signal quality. 
S o 


fil: Microphone arrays capture the spatial characteristics of the sound field to improve voice signal quality. 
S [9] 


步骤 三 。 简化 句子 ， 提 取 SAO 结 构 
Microphone arrays capture improve voice signal. 
S a a [9] 
步骤 四 “SAO 结 构 分 组 ， 将 具有 相同 S 和 O 的 分 为 一 组 


Si- (Sii. S12; 77. Sin } 
O;- (Oii. O12, ***, Or } 
Sins 


获取 训练 样本 集 : 随机 抽取 一 定 比例 SAO， 通 过 人 工 标注 方式 表征 技术 


将 未 分 类 的 SAO 集 合 输入 训练 好 的 LSTM 模 型 ， 获 得 全 部 SAO 进 化 关系 


到 类 别 分 布 向 量 , 从 而 完成 对 分 类 模型 的 有 效 训练 。 
第 七 ,将 剩余 未 分 类 的 SAO 结构 输入 至 训练 好 的 
模型 中 ,最终 得 到 所 有 S 和 0 之 间 的 关系 分 类 。 
为 了 系统 展示 本 部 分 的 研究 逻辑 ,笔者 用 图 2 对 
这 一 流程 进行 详细 的 表述 : 


NNS IN DT JJ NN TO VB NN 本 NN 


a 


On 分 别 为 St、Oi 的 同 义 /同形 异 构 形式 


对 模型 进行 训练 


XIV 


4 plus 


- 斧 语 音 识别 是 人 工 智能 领域 的 重要 发 展 方向 ,在 经 
历久 中 式 发 展 之 后 , 增 速 逐渐 放 缓 ,市 场 迫 切 需要 寻找 
新 的 切入 点 进行 产业 创新 。 在 此 背景 下 ,笔者 以 语音 


识别 领域 为 研究 对 象 ,探索 该 领域 潜在 的 技术 创新 方 
式 , 并 以 此 检验 本 研究 方案 的 可 行 性 。 


图 2 SAO 结构 提取 及 核心 演化 关系 识别 流程 示意 


合 。 笔 者 在 信息 检索 理论 的 指导 下 ,从 “关键 词 ”及 
“专利 分 类 ”两 个 视角 综合 制定 领域 检索 策略 。 基 于 
关键 词 的 搜索 方案 能 较 全 面 地 获取 领域 整体 数据 ,而 
在 此 基础 上 基于 专利 分 类 的 二 次 检索 , 则 能 有 效 “ 修 
饰 "数据 集合 ,保证 检索 数据 的 准确 性 。 在 这 一 构建 思 
路 的 指导 下 ,结合 文献 调研 结果 ,笔者 构建 了 领域 检索 
式 (如 表 2 所 示 ) ,并 获取 了 本 领域 2011 - 2021 年 的 


4.1 领域 数据 获取 及 清 ; 8 818 条 DII 同族 专利 数据 。 
为 全 面 妃 踪 领 域 的 研发 进展 ,挖掘 潜在 的 技术 组 
表 2 检索 策略 
字段 编号 检索 式 pi ” E. T 
主题 词 #1 TI = (speech-recogni * OR " speech recogni * " OR (speech NEAR/1 recogni * ) OR ASR) OR AB= 2011 -2021 — 8818 
(speech-recogni * OR "speech recogni *" OR (speech NEAR/1 recogni * ) OR ASR) 
特 温 特 手工 代码 #2 MAN = (TO1-J18 OR TO1-CO8A OR W01-C01Q4 OR W01-C01B5B OR W01-C01Q8C OR W02-G02A5C 
OR WO02-K06 OR W03-A02CSL OR W04-V01 OR W04-V04 OR W04-V05 OR W04-V09 OR X22-L OR 
W03-A18A6 OR W03-B08C3 OR W03-B08C8 ) 
IPC 分 类 号 15 IP = (G10L-015/00 OR G10L-015/01 OR G10L-015/02 OR G10L-015/04 OR G10L-015/06 OR GIOL- 


015/08 OR G10L-015/20 OR GI0L-015/22 OR GIOL-015/24 OR GIO0L-015/26 OR GIOL-015/28) 
最 终 检 索 式 :机 and #2 and #3 
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在 获取 初始 检索 结果 的 基础 上 ,笔者 利用 ITGin- 
sight 软件 和 Python 对 数据 进行 清洗 与 合并 :通过 IT- 
Ginsight 软件 对 专利 数据 进行 分 词 ; 巴 通过 建立 词 表 对 
停 用 词 和 共性 词 进 行 过 滤 ;@@ 通 过 ITGinsight 软件 中 的 
C-value 术语 提取 算法 和 机 器 自动 分 组 功能 ,对 语义 进 
行 模糊 匹配 ,从 而 合并 同形 异 构 词 ; 引 在 领域 专家 的 参 
与 下 ,以 术语 度 大 于 15 . 词 频 大 于 10 作为 租 选 依据 ,对 


领域 核心 关键 词 进行 初步 筛选 ;加 语义 合并 。 对 “in- 


"cw "m 


telligent furniture "" intelligent household appliance 


smart home device" 等 机 器 无 法 自动 合并 的 同义词 术 
语 , 则 基于 专家 智慧 建立 合并 规则 ,并 通过 Python 进行 
自动 合并 。 经 过 一 系列 的 清洗 步骤 ,最 终 得 到 1 053 
个 领域 核心 主题 。 具 体 的 分 词 及 清洗 流程 如 表 3 
Bra: 


RI 技术 词 清洗 步骤 


步 又 清洗 方案 词 数量 /个 
1 利用 NLP 模块 进行 领域 分 词 16 774 
2 建立 词 表 去 除 停 用 词 .科技 文献 中 的 共性 词 ,如 " research method" 12 548 
3 通过 ITGinsight 软件 集成 的 机 器 分 组 功能 进行 语义 模糊 匹配 ,合并 具有 相同 词 干 的 词汇 ,如 " search query" 和 " search queries" " speech 8 231 
recognition" ffl" speech-recognition" 
4 选取 词 频 大 于 10 术语 度 大 于 05 的 词 4 137 
y 基于 专家 智慧 整合 同义词 ,如 "intelligent furniture" "intelligent household appliance" " smart home device" 1 053 


4s 语音 识别 领域 技术 创新 组 合 识别 

@GD 为 建立 技术 主题 之 间 的 语义 关联 网 络 ,笔者 将 上 
视 盐 清洗 过 的 领域 文本 数据 作为 语 料 和 输入 ,利用 gen- 
seda pg Word2Vec 模型 进行 训练 ,将 筛选 出 的 1 053 
需要 说 
H 是 ,由 于 Word2Vee 默认 生成 的 词 向 量 以 单个 词 为 
2 x 两 个 或 两 个 以 上 单词 构成 的 词组 。 


究 将 术语 组 (词组 ) 作为 一 个 整体 进行 向 量 转化 ， 
该 种 转化 方式 保 留 了 词组 的 语义 信息 ,更 有 利于 建立 
语义 关联 的 技术 网 络 。 

(5 在 构建 基于 词组 向 量 的 基础 语义 网 络 之 后 ,笔者 利 
用 GEDP 法 探索 核心 技术 主题 及 关联 的 技术 创新 要 素 。 
图 BX 左 图 ) 展 示 了 1 053 个 核心 技术 点 的 密度 和 距离 分 
布 S 其 中 , 横 坐标 代表 密度 , 纵 坐 标 代表 距离 ,位 于 左 图 右 
上 和 角 部 分 的 节点 表示 该 类 节点 中 心性 高 且 距 其 他 中 心 节 
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点 的 距离 大 。 深 入 分 析 发 现 ,“ 可 穿戴 设备 ”( wearable de- 
vice) “神经 网 络 算法 ”(neural network algorithm ) “语音 
控制 模块 ”( voice control module) , “语音 识别 环节 ?” 
(speech recognition section) ) “多 通道 ”( multi-pass ) “语音 
识别 准确 率 ”(speech recognition accurate )6 个 节点 在 语音 
识别 领域 处 于 核心 地 位 。 其 中 ， 语 音 识 别 环节 ”与 “语音 
识别 准确 率 " 关联 度 较 大 ,笔者 将 其 归并 成 一 个 核心 节点 。 

在 此 基础 上 ,笔者 进一步 根据 距离 这 一 指标 筛选 
核心 节点 周围 具有 组 合 潜力 的 技术 要 素 。 其 中 ,距离 
核心 节点 越 近 的 点 , 越 有 可 能 与 其 形成 具有 潜在 创新 
价值 的 技术 组 合 。 在 专家 的 辅助 下 , 共 筛 选 出 115 个 
技术 点 ,并 基于 其 距离 .密度 关系 ,形成 “语音 控制 技 
术 “ 语 音 识 别 模型 算法 “智能 语音 产品 及 应 用 “ 语 
音 识 别 技术 新 场景 “语音 识别 技术 性 能 ”5 个 潜在 的 
技术 创新 组 合 , 如 图 3 中 的 右 图 所 示 : 
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图 3 技术 创新 要 素 及 创新 组 合 分 组 示意 
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为 了 深入 挖掘 各 技术 组 合 中 要 素 间 的 创新 演化 关 
系 ,本 研究 需 在 充分 理解 领域 技术 构成 方式 的 基础 上 ， 
对 领域 的 基础 模块 进行 划分 。 

通过 文献 阅读 与 专家 访谈 ,笔者 将 该 领域 划分 为 
5 个 子 模块 ,并 依据 模块 间 的 构成 ,依赖 关系 ,构建 领 
域 概念 模型 , 见 图 4。 在 该 领域 中 ,5 个 子 模块 分 别 为 : 
支撑 平台 与 技术 算法 与 模型 .技术 性 能 .产品 与 应 用 
以 及 市 场 需求 等 。 其 中 ,“ 算 法 与 模型 " 子 模块 是 语音 
识别 领域 的 核心 ,新 的 产品 和 应 用 依赖 于 算法 的 突破 ， 
同时 新 产品 又 满足 特定 的 市 场 需 求 。 在 所 有 子 模块 
中 ， 文 撑 平 台 与 技术 "是 基础 ,保障 行业 技术 创新 与 
产品 更 新 。 

基于 此 ,笔者 进一步 将 各 组 合 中 的 技术 要 素 进 行 
子 模块 划分 ) 。 该 分 组 方式 可 有 效 帮 助 利益 相关 
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支撑 平台 与 技术 
图 4 语音 识别 技术 领域 概念 模型 


者 从 技术 组 成 的 角度 理解 领域 技术 演化 方式 及 创新 机 
理 。 表 4 系统 展示 了 各 组 合 中 技术 要 素 的 分 组 情况 。 


T 表 4 组 合 创新 要 素 及 隶属 关系 
N RK 隶属 子 模块 创新 要 素 
O R% 1: 算法 与 模型 language model „acoustic model | large vocabulary continuous speech recognition ( lvesr) , n-best lists deep learning 


GE 识别 模型 算法 (A-1) 


er 市 场 需 求 


neural network ,natural language understanding 


speech sample noise , word lattice ‚context information „hot word „prosody „key phrase „speech enhancement „speech e- 


e (A-2) motion recognition „dialect ‚mandarin ,time code „real-time voice 
CD R2: 支撑 平台 与 技术 storage unit, Field Programmable Gate Array ( FPGA ) „voice identification module „loudspeaker \remote controller Dig- 
E 语 音 芯 片 技 术 (B-1) ital Signal Processing (dsp) „bluetooth module ,zigbee „antenna MCU , SOC 
e 产品 与 应 用 (B-2) lamp lock „door „wheelchair 
N R3, 支撑 平台 与 技术 artificial intelligence „IOT , Voice over Internet Protocol ( VOIP ) „language system „digital network 
能 语音 产品 及 应 用 (C-1) 
< 产品 与 应 用 mobile phone ,camera „bluetooth headset air conditioner „refrigerator ,autonomous vehicle „hearing aid „healthcare , 
>< (C-2) television „digital assistant \GPS „self-service smart speaker ,head-mounted device( HMD) 
RŽ 4: 算法 与 模型 real-time speech recognition , robust automatic speech recognition, voice control. method , context awareness , complex 
E 识别 需求 与 场景 (D-1) linear projection 
C 市 场 需求 multi modal application 、speech to text conversion , simultaneous interpretation , multiple device , multi-language , 
Q (D-2) multi-person ,voice wake up ,user feedback 
R% 5. 技术 性 能 response time , bandwidth , portability , speech recognition error, speech recognition effect, speech recognition rate, 
语音 识别 技术 性 能 (E-1) speech recognition precision ,robustness 
市 场 需求 (E-2) anti-noise ,noise reduction ,noise suppression ‚operation instruction ‚control command 


4.3 组 合 创新 方式 及 技术 机 会 探索 

以 上 阶段 获取 的 技术 组 合 为 研究 对 象 ,本 部 分 借 
助 SAO 理论 ,挖掘 各 技术 组 合 中 创新 要 素 间 的 技术 演 
化 关系 。 本 研究 关注 两 种 创新 机 制 :一 种 是 组 内 创新 
要 素 间 的 演化 创新 ; 男 一 种 为 组 间 通 过 技术 融合 应 用 
转移 带 来 的 融合 创新 。 以 上 阶段 获取 的 115 个 创新 要 
素 ( 短 语 ) 为 输入 ,利用 正则 表达 规则 从 原始 文本 中 抽 
取 包 含 两 个 创新 要 素 的 短 句 。 如 句子 " Microphone ar- 


rays capture the spatial characteristics of the sound field to 


improve voice signal quality. " 中 S 为 " Microphone ar- 
rays" ,0 Jg" voice signal" 。 同 时 ,调用 nltk 包 中 的 词性 
标注 方法 ,识别 短文 本 中 的 动词 ,从 而 将 短文 本 化 简 成 


仅 包含 两 个 创新 要 素 ( 名 词 ) 及 创新 关系 (动词 ) 的 
SAO 结构 ,如 上 例 最 终 被 简化 为 " Microphone arrays 
capture improve voice signal" 。 通 过 这 一 步 处 理 , 共 获 
取 14 548 个 SAO 结构 。 

基于 领域 调研 和 专家 讨论 ,笔者 认为 在 语音 识别 
这 一 领域 ,产业 界 最 为 关注 的 创新 关系 有 4 种 :技术 演 
化 升级 (提升 关系 ) .技术 融合 (包含 关系 ) 、 负 效应 消 
除 ( 减 弱 关 系 ) 以 及 产品 应 用 (应 用 关系 ) 。 由 于 涉及 
的 SAO 结构 数据 多 ,笔者 借助 深度 挖掘 算法 ,对 115 个 
核心 技术 创新 要 素 间 的 创新 关系 进行 探索 。 为 了 保证 
SAO 关系 识别 的 精准 性 ,本 研究 随机 选取 3 000 条 
SAO 结构 进行 人 工 标注 ,并 以 此 作为 分 类 算法 的 测试 
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集 和 训练 集 。 随 后 ,基于 人 工 标 注 过 的 数据 训练 LSTM 
模型 ,通过 调整 模型 参数 来 提高 模型 预测 的 准确 率 , 模 
型 最 终 的 分 类 正确 率 达 到 85% 。 

需要 说 明 的 是 ,为 了 验证 LSTM 在 短文 本 分 类 性 
能 上 的 优越 性 ,本 研究 基于 相同 的 测试 数据 ,对 其 他 4 
种 常用 分 类 算法 (朴素 贝 叶 斯 .逻辑 回归 分 类 器 支持 
向 量 机 随机 森林 ) 的 分 类 准确 性 进行 了 测算 ,结果 如 
表 5 所 示 : 

表 5 常用 的 4 种 分 类 算法 的 分 类 准确 性 测算 


实验 次 数 “朴素 贝 叶 “逻辑 回归 支持 向 量 ”随机 森林 LSTM/% 
/准确 率 斯 /% 分 类 器 /% 机 /9% /% 

第 1 次 65 72 75 70 86 
第 2 次 64 73 73 73 85 

第 3 次 67 74 71 69 83 
EI 63 70 72 70 87 

P 次 66 75 75 70 82 
T 

fü 65 72.8 73.2 70.4 85 


thresh valuspera 


noise decim “os i— 


paflnt 


202304.007 


IV 
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hd Ds 


从 表 5 中 数据 可 知 , 相 较 于 其 他 机 器 学 习 算法 ， 
LSTM 算法 在 对 SAO 演化 关系 的 分 类 精度 上 提高 了 
10% -20% ”。 最 后 ,笔者 用 训练 好 的 模型 对 剩余 的 
SAO 结构 进行 分 类 。 表 6 展示 了 部 分 分 类 结果 : 

表 6 SAO 核心 演化 关系 识别 结果 ( 部 分 ) 


s 0 核心 关系 数量 
multi directional microphone unit 提升 63 
microphone array 
guide voice voice command 提升 38 
voice command mobile phone 应 用 38 
digital assistant mobile device 应 用 26 
noisy environment accuracy 减弱 18 
noisy speech recognition precision 减弱 24 
corpora speech recognition model 包含 44 
main controller wireless communication module ”包含 22 


对 115 个 技术 要 素 间 的 创新 关系 进行 可 视 化 展 
IR ,结果 如 图 5 Bron: 


聚 类 1: 语音 识别 模型 算法 
聚 类 2: 智能 语音 芯片 技术 
RKI: 智能 语音 产品 及 应 用 
聚 类 4: 语音 识别 需求 与 场景 
聚 类 5: 语音 识别 性 能 


5 技术 组 合 关系 


5 中 不 同 聚 类 的 技术 节点 代表 其 隶属 于 不 同 的 
技术 组 合 , 节 点 间 连 线 的 粗细 代表 关联 节点 间 演 化 关 
系 的 强 弱 。 从 图 5 中 可 以 看 出 ,语音 识别 领域 的 主题 
关联 度 高 。 这 种 关联 度 不 仅 体现 在 组 内 关联 上 ,组 间 


也 存在 显著 联系 。 为 了 深度 挖掘 组 内 创新 及 组 间 进 化 
方式 ,结合 表 4 中 的 技术 分 组 ,笔者 对 核心 的 技术 创新 
关系 进行 深入 探索 。 

AS 1 代表 “语音 识别 模型 算法 ” ,相关 技术 可 分 
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为 两 个 子 领域 : (A-1 ) 为 算法 模型 , (A-2 ) 为 行业 需求 
及 应 用 。 对 该 组 合 的 SAO 结构 深入 挖 所 后 发 现 ,“ 语 
音 识别 模型 "是 该 组 合 中 最 基础 .最 核心 的 技术 ,与 其 
相关 的 SAO 关系 占 该 组 合 所 有 关系 的 65% ,“ 语 言 模 
型 “声学 模型 “发 音字 典 "是 其 主要 组 成 部 分 ,直接 
决定 了 语音 识别 的 识别 效果 。 据 调查 , 随 着 语音 识别 
模型 性 能 上 的 突破 ,智能 语音 技术 进入 落地 期 ,国内 语 
音 识别 头 部 企业 科大 讯 飞 .搜狗 . 依 图 科技 等 均 对 语音 
识别 算法 模型 进行 深入 探索 ,在 国际 赛事 中 获得 亮 眼 
成 绩 "”"。 在 行业 需求 及 应 用 子 领域 ,“ 神 经 网 络 算法 
“促进 "语音 搜索 "(SAO 结构 出 现 45 次 ) ,这 表明 神经 
网 络 算法 可 以 提升 语音 搜索 的 效果 。 值 得 关注 的 是 ， 
人 工 智能 算法 .语音 交互 和 语音 控制 技术 是 近年 来 该 
领域 的 关注 焦点 1。 

> 笔者 重点 关注 这 一 技术 组 合 中 的 核心 技术 传递 
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聚 类 2 rc £o Ne" IL BET EO ON. UH 
关 创 新 要 素 隶 属于 软 硬 件 文 撑 (B-1 ) 及 产品 与 应 用 
(B-2 ) 这 两 个 子 模块 。 通 过 SAO 语义 挖掘 可 知 ,本 组 
合 中 最 重要 的 两 组 SAO KRY: OD" Z v UE TU * fie 
进 "麦克 风 模 块 ” ,该 演化 关系 共 出 现 37 次 ,这 表明 采 
用 麦克 风 阵 列 技术 可 以 有 效 提高 麦克 风 模 块 对 语音 信 
号 的 采集 能 力 , 有 利于 提升 语音 识别 精度 ; “MCU 
ERN FPGA ,应 用 于 语音 控制 模块 "(出 现 18 次 ) , 体 
现 了 语音 识别 芯片 的 升级 ,为 新 的 场景 和 应 用 提供 了 
可 能 。 其 中 硬件 FPGA 具有 可 编程 .可 重 构 .并行 计算 
等 优点 ,提升 了 语音 控制 设备 的 电路 性 能 .设计 的 灵活 
性 与 效率 , 目前 已 经 成 为 语音 识别 系统 硬件 加 速 的 重 
X47". 。 而 另 一 硬件 MCU 虽 性 能 不 如 FPGA ,但 其 
较 低 的 功 耗 和 较 小 的 尺寸 非常 适合 小 型 能 入 式 语 音 识 
别 设备 ,在 (B-2) 智 能 灯 、` 智 能 门 锁 以 及 智能 可 穿戴 设 


者 :谷歌 (352 项 专利 ) 和 百度 (160 项 专利 )。 通 过 分 
析 与 之 相关 的 SAO 结构 后 发 现 , 两 家 企业 在 该 领域 的 
专利 布局 十 分 相似 。 谷 歌 在 整体 专利 数量 和 综合 技术 
实力 等 方面 处 于 优势 地 位 。 然 而 在 深度 学 习 算 法 领 
域 ,百度 的 专利 数量 基本 与 谷歌 持平 ,并 在 中 文 语音 识 
别 和 方言 识别 等 方面 领先 。 深 入 调研 后 发 现 ,百度 通 
过 与 中 国 科学 院 声 学 研究 所 合作 、 聘 任 人 工 智能 领域 
专家 吴 恩 达 作为 企业 的 首席 科学 家 ,以 此 来 缩小 与 谷 
歌 在 该 领域 的 差距 ”。 但 在 多 语言 识别 .语音 搜索 、 
语音 输入 法 等 领域 谷歌 依然 领先 于 百度 。 值 得 注意 的 
是 ,国内 男 一 家 在 该 领域 研发 多 年 的 企业 科大 讯 飞 也 
具有 类 似 的 专利 技术 结构 。 探 索 百度 与 科大 讯 飞 的 联 
合 发 展 模式 ,将 会 有 效 提升 我 国 在 该 领域 的 国际 优势 
地 位 。 如 图 6 所 示 : 
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6 聚 类 1 中 技术 传递 系统 示意 


备 中 有 着 较为 成 熟 的 应 用 。 经 调查 ,2019 - 2020 年 在 
全 球 范围 内 投资 金额 增长 最 为 迅速 的 人 工 智 能 子 领域 
是 “语音 识别 "和 “人 机 对 话 ”。 其 中 ,为 语音 识别 等 特 
定 任务 设计 的 专用 芯片 获得 国际 市 场 的 大 量 融 资 。 
这 一 趋势 也 从 一 定 程度 上 验证 了 本 研究 结论 的 准 
确 性 。 

值得 关注 的 是 ,在 这 一 组 合 中 ,智能 语音 芯片 、 集 
成 语音 控制 技术 是 近年 来 领域 关注 的 焦点 。 在 本 组 合 
涉及 的 1522 项 专利 中 ,Nvidia、Intel .Altera、 寒 武 纪 、 华 
为 浪潮 等 公司 拥有 最 多 的 领域 专利 。 深 入 挖掘 发 现 ， 
Nvidia 牢 牢 把 握 着 传统 GPU 硬件 加 速 技术 的 话语 权 ， 
而 Intel 通过 收购 FPCA 领域 的 巨头 Altera 公司 ,希望 
通过 探索 "CPU + FPGA" 的 技术 方案 来 实现 转型 。 面 
对 Nvidia 和 Intel 在 语音 芯片 领域 构筑 的 专利 壁 公 ， 
内 智能 芯片 厂商 寒 武 纪 选 择 避 开 CPU, GPU 等 较为 成 
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熟 的 技术 路 线 ,利用 自身 的 优势 分 别 与 华为 、 海 思 、 浪 
潮 和 中 科 院 展开 合作 ,在 MCU .专用 集成 芯片 (ASIC ) 
等 领域 寻求 技术 突围 。 可 以 预见 ,在 该 技术 领域 ， 


CPU+FPGA Intel 
解决 方案 CPU 


FPGA Nvidia 
专用 GPU 芯片 


传统 硬件 厂商 与 新 人 局 厂商 之 间 的 竞争 将 不 可 避免 。 
如 图 7 所 示 : 


| 宏武 纪 一 一 一 > 中 国 科 学 院 
ASIC 智能 算法 


合作 


浪潮 
云 计算 支持 


图 7 R2 中 技术 传递 系统 示意 


RRS 中 技术 组 合 代表 “智能 语音 产品 及 应 用 ”， 
相 美的 技术 隶属 两 个 子 模块 。( C-1 ) 是 语音 识别 技术 
的 攀 硬 件 基础 ,其 中 人 工 智 能 、 物 联网 等 技术 的 发 展 ， 
极 天 地 推动 了 语音 识别 技术 在 智能 家 居 设 备 ,智能 可 
强加 设 备 .导航 设备 自助 服务 终端 (kiosk ) 等 产品 (C- 
NPRM. WR A RERURL ALS RO 2( 语音 控 千 
PR) 和 到 类 4( 语音 识别 技术 新 场景 ) 中 技术 要 素 间 
的 六 又 融合 关系 非常 显著 。 
cort, RÆ 2 中 (B-2 ) 语 音 控制 系统 的 发 展 ,改变 
JEN 机 交互 的 方式 ,使 语音 识别 产品 成 为 了 控制 智能 
空调 ,电视 等 智能 家 居 设备 的 重要 和 人 口 。 而 数字 助理 、 
吞 能 语音 交互 等 功能 也 在 手机 .相机 可 穿戴 设备 等 移 
动 菇 漠 设 备 (C2) 上 有 了 很 多 商业 转化 。 而 图 5 中 到 
JI 语音 识别 需求 与 场景 "中 "数字 助理 "应 用 于 " 终 
端 误 备 " 这 一 演化 关系 出 现 次 数 最 多 ,这 表明 用 户 通过 
语音 与 终端 设备 交互 的 场景 越 来 越 普遍 ,语音 识别 技 
术 的 发 展 为 满足 新 的 场景 需求 和 交互 体验 带 来 无 限 可 
能 。 除 此 之 外 ,“ 多 模 态 "“ 多 设备 "““ 多 语言 "““ 多 目 
标 “ 实 时 ”和 “反馈 ”等 行业 需求 在 该 技术 组 合 中 出 现 
频次 较 高 ,与 聚 类 2“ 智能 语音 产品 及 应 用 "( C-2 ) 存在 
紧密 关联 ,由 此 可 以 预见 ,实时 语音 识别 ,多 模 态 语音 
识别 等 技术 将 催生 更 多 应 用 语音 识别 技术 的 智能 产 
品 ,来 满足 复杂 场景 下 的 多 样 化 需求 。 针 对 当前 市 场 
上 最 为 火热 的 语音 识别 与 交互 应 用 技术 ,2021 年 5 月 
中 国电 器 科学 研究 院 联合 美的 等 家 电 龙 头 企业 共同 纺 
制 的 国家 标准 计划 《智能 语音 控制 器 通用 安全 技术 要 
求 》 获 准 立项 ,该 标准 为 语音 控制 器 相关 行业 的 健康 发 
展 提供 保障 ” 。 

聚 类 5 技术 组 合 代表 “语音 识别 性 能 " 。 该 技术 组 
合 包含 (E-1) 性 能 指标 和 (了 -2 ) 行 业 需 求 两 个 子 领域 。 


is 


通过 对 文本 的 语义 挖掘 可 知 ,本 组 合 中 出 现 次 数 较 多 
的 SAO 结构 为 :“ 降 噪 技术 “提升 ' 语 音 识别 精度 ”, 该 
演化 关系 共 出 现 24 次 。 说 明 在 复杂 场景 下 ,通过 在 语 
音信 和 号 的 采集 和 处 理 阶段 应 用 降 噪 技术 ,可 以 降低 背 
景 噪声 对 语音 质量 的 影响 , 从 而 提升 语音 识别 准 
mR, 

除 此 之 外 ,图 5 中 聚 类 5 与 聚 类 2 的 组 间 关 联 也 
十 分 显著 。 智 能 芯片 提升 了 语音 信和 号 的 处 理 速率 , 算 
法 模型 为 语音 识别 的 精度 提供 保障 。 随 着 语音 识别 技 
术 向 更 多 行业 渗透 ,医疗 ,交通 等 复杂 场景 也 对 语音 识 
别 技术 的 各 方面 性 能 提出 了 更 高 的 要 求 , 鲁 棒 性 语音 
识别 、 远 场 语音 识别 , 混 响 环境 下 语音 识别 等 技术 极 具 
发 展 潜力 。 近 年 来 国家 重大 研发 计划 、 省 重点 研发 项 
目 等 发 展 计划 均 为 相关 企业 的 研究 立项 给 予 经 费 支 
持 , 如 思 必 驰 信息 科技 有 限 公 司 开展 “医疗 场景 语音 识 
别 " 研 究 ,科大 讯 飞 开展 “基于 庭 上 多 人 多 方言 语音 识 
别 和 司法 审判 信息 资源 库 的 庭审 虚拟 助手 技术 "研究 ， 
四 川 大 学 视觉 合成 图 形 图 像 技术 国家 重点 实验 室 与 四 
川 川 大 智 胜 软件 股份 有 限 公 司 联合 开展 “复杂 环境 下 
空 管 语音 识别 与 语义 理解 引擎 关键 技术 及 应 用 ” 
HA, 

通过 对 语音 识别 领域 组 内 创新 及 组 间 创 新 关系 的 
深入 挖掘 ,一 些 有 意义 的 现象 值得 关注 ,具体 如 下 ; 

(1) 语 音 识别 领域 在 算法 和 模型 领域 竞争 较为 激 
烈 ,厂商 间 专 利 合作 较 少 ,国内 企业 虽 在 中 文 语音 识别 
等 部 分 领域 取得 领先 ,但 整体 技术 实力 依然 落后 于 
到 外 。 

(2) 在 语音 识别 软 硬 件 和 产品 应 用 领域 ,语音 识 
别 服务 商 与 芯片 企业 和 传统 制造 行业 合作 紧密 , “云端 
芯 ” 一 体 化 的 模式 成 为 发 展 趋势 ,语音 识别 技术 的 应 用 
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领域 也 越 来 越 广泛 。 

(3) 国 内 语音 识别 技术 厂商 在 技术 研发 阶段 应 开 
展 合 作 创 新 以 突破 国外 的 搁 术 封锁 和 市 场 垄断 ;在 技 
术 应 用 阶段 应 当 加 强 与 传统 制造 行业 的 合作 ,共同 开 
发 面向 新 场景 .新 需求 的 智能 语音 识别 产品 和 应 用 。 


5 结语 


笔者 提出 了 一 种 基于 专利 数据 的 技术 创新 组 合 识 
别 与 追踪 方法 ,并 以 语音 识别 领域 为 例 , 对 此 方法 的 有 
效 性 进行 了 验证 。 此 方法 通过 Word2Vec 算法 构建 领 
域 语义 网 络 ,并 利用 CFDP 算法 得 到 具有 潜在 关联 的 
技术 组 合 。 同 时 ,本 研究 基于 SAO 法 来 识别 技术 主题 
之 间 的 关系 ,并 通过 训练 LSTM 深度 学 习 模 型 实现 对 
iet SAO 结构 的 精准 分 类 ,实现 了 对 创新 要 素 间 组 合 
进 伦 规律 的 探索 ,预测 了 洪 在 的 技术 机 会 。 基 于 这 一 
研 穷 方案 ,笔者 对 语音 识别 领域 开展 案例 研究 ,验证 了 

究 方法 在 技术 创新 组 合 与 创新 方式 识别 上 的 有 效 
性 本 同时 ,也 为 语音 识别 领域 的 未 来 研发 及 政策 制定 
提供 有 力 支撑 。 

@ 本 研究 也 存在 一 定局 限 性 , 仅 从 技术 驱动 的 层次 
创新 组 合 进行 识别 和 追踪 ,尚未 从 多 因素 驱动 角度 
en 
述 行 分 析 , 维 度 较为 单一 ,后 续 将 会 从 期 刊 数据 政策 
文 多 .社交 媒体 等 多 渠道 数据 进行 拓展 与 挖 气 。 
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Identifing and Tracing Technological Innovation Combination Based on 
Deep Learning and Semantic Mining 
Zhou Xiao’ Xu Yinbiao Shi Yi 
' School of Economies and Management, Xidian University, Xi’ an 710126 
? College of Computer Science, Xi’ an Shiyou University, Xi’ an 710065 
Abstract; | Purpose/Significance | With the rapid development of strategic emerging technology industries , 
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chow to identify technological innovation combinations with potential synergistic effect and clarify the core innovation 
relationships in the combination is an important prerequisite for effectively planning industrial development routes and 
ancing industrial competitive advantages. | Method/Process | Guided by the theory of technology portfolio evolu- 
Cüdn, this paper based on patent data and proposed a recognition scheme of technological innovation combinations and 
Brolution relationships , which combined algorithms such as deep learning, SAO semantic mining and CFDP. The 
Sstúdy protocol was divided into 3 steps: The first step was to design a domain search strategy based on keywords and 
Datent classification numbers and completed the cleaning and word segmentation of the acquired data; Then the study 
i the word vector semantic network of the technical topics in the domain through Word2 Vec , and used the CFDP al- 
Trim to identify potential innovation elements and combination methods; Finally, it deeply explored the core SAO 
structures in each portfolio, classified their evolutionary relationships through the LSTM deep learning algorithm, and 
explored the core innovation approach of technology, so as to effectively discover the potential technology chance in 
the domain. | Result/Conclusion | Taking the field of speech recognition as an example, through in-depth mining of 
DII patent text data in this field, the study has identified and tracked five types of potential technological innovation 
combinations and core innovation methods. And the study finds that the current speech recognition field, which is in 
the smart chip design, speech recognition algorithms , new scenarios and applications, has great potential for techno- 
logical innovation in China. 
Keywords: technological innovation combination identification deep learning SAO semantic mining patent 


analysis 


44 


